G 中 


摘 要 选取 山竹 台风 典型 受灾 地 区 (广东 ) 和 非 受灾 地 区 (安徽 ) 微 博 ) 
法 从 时 间 和 空 


Sa 
风 过 境 


提供 


山竹 台风 影响 下 受灾 群众 心理 状态 的 台风 有 眼 效应 
一 一 基于 时 间 与 空间 维度 的 微 博 行为 数据 分 析 : 


RUER A 
C 中 
C 


国 科学 院 心理 和 


x 间 两 个 维 


度 检验 心理 


me 


周 意 勇 24 EF 
国 科学 院 心 理 丰 


国 科 学 院 心理 丰 


je 4 卢 江 丰 24 程 羽 慧 34 何 婷 婷 24 朱 廷 动 : 
究 所 行为 科学 重点 实验 室 ， 北 京 100101) 


重点 实验 室 ， 北 京 100101) 


ini 


完 所 心理 健 局 


完 所 ， 脑 与 认 知 科学 国家 重点 实验 室 ， 脑 科学 与 智能 技术 音 越 创新 中 心 ， 


100101) 


(4 中 国 科学 院 大 学 心理 学 


系 ， 北 京 100049) 


j 户 的 行为 数据 ， 使 用 
结果 发 现 ， 在 时 间 维 度 上 ， 


台风 眼 效应 。 


受灾 地 


但 并 没有 表现 出 “高 - 低 -高 ”的 心理 台 


风 眼 模式 ， 具 体 来 说 ， 受 灾 地 区 在 台风 过 境 后 对 


We 


关键 词 
分 类 号 


考 和 借 
tre 


B849 


金 。 


1 前 言 


山竹 台 


月 16 


4 


W 


O 


近 300 万 人 受灾 ，160.1 万 人 紧急 避 
家 和 人 民 造 成 了 严 习 
在 造成 4 


Qu fay ER 


灾难 来 临 


角 地 认识 和 描 ; 


前 ， 而 台风 来 临 前 与 过 境 

区 和 未 受灾 地 区 在 对 台风 的 关注 
相关 思 
风 ; 时 间 ; 


(Typhoon Mangkhut) 作 为 珠 三 角 地 区 37 年 来 


E 命 财产 损失 的 同时 ， 
述 此 次 台风 给 


、 来 临 后 与 过 境 中 对 台风 关注 程度 没有 显著 差异 ; 在 空间 


区 对 台风 的 关 举 
关注 程度 高 于 台 


北京 


大 数据 分 析 的 方 
存在 差 


维度 上 ， 受 灾 地 


度 上 不 存在 显著 差异 。 本 文 对 研究 的 局 限 性 进行 了 分 析 ， 


空间 ; 大 数据 ; 心理 台风 眼 效应 


微 博 


三 | 


HY 


登陆 ， 短 短 两 天 内 造成 广东 、 广 西 、 


海南 、 湖南 、 贵州 5 省 ( 


大 的 台风 灾害 (国际 编号 1822)， 


以 期 为 未 来 研究 


于 2018 
导致 


区 )， 


pa 


方 


险 转 移 和 安置 ，1200 余 间 


EE 的 生命 和 财产 损失 ( 何 畅 , 2018)。 


5 


区 人 民 的 心理 造成 
响 ， 是 解决 灾后 心理 援助 问题 、 


然 灾害 往往 也 会 给 受灾 地 


众 带 来 的 心理 影 


SEI 


前 对 人 民心 态 进行 调整 的 基础 ( 沈 世 林 , 张 彩云 , & 王 玉 萍 , 2014)。 本 研究 致力 于 次 ， 拟 利用 


通讯 作者 : 


AER, tszhu@ucas.ac.cn 。 


屋 倒 塌 ， 直 接 经 济 损失 52 亿 元 ， 给 


国 


巨大 的 冲击 和 伤害 。 
后 续 在 


他 


大 数据 分 析 手 段 ， 从 时 间 和 空间 两 个 维度 出 发 探究 对 于 台风 灾难 前 后 、 受 灾 与 非 受灾 地 区 人 民心 理 状 
况 的 动态 变化 轨迹 。 

鉴于 台风 是 可 以 预测 的 一 种 天 灾 ， 我 们 需要 了 解 台风 发 生前 (得 知 台风 消息 后 到 台风 登陆 前 )、 台 
风 发 生 中 、 台 风 结 束 后 (台风 撤离 ) 的 一 段 时 间 ， 相 关 受 灾 群 众 的 心理 变化 过 程 是 怎样 的 ， 这 可 以 帮助 
心理 工作 人 员 在 不 同 的 时 期 选择 不 同 的 心理 干预 手段 。 已 经 有 一 些 心理 学 研究 ， 对 受灾 地 区 人 民心 
情况 的 变化 进行 了 一 定 的 解释 。 以 往 研 究 表明 ， 在 灾难 发 生 的 时 间 和 空间 维度 上 ， 存 在 着 一 种 "心理 
台风 眼 效应 "Psychological typhoon eye effect)， 即 在 时 间 维 度 上 ， 越 接近 高 风险 时 段 ， 心 理 越 平静 ; 在 
空间 维度 上 , 越 接近 高 风险 地 点 , 心理 越 平静 ( 李 纾 ,刘欢 ， 白 新 文 ,， 任 孝 觅 ， 郑 营 ， 李 金 珍 ， 饶 俩 琳 , TE 
EE, 2009)。 该 理论 已 经 在 空间 维度 ( 李 纾 等 , 2009)、 以 及 从 灾后 的 时 间 维 度 CE, GRU, AAS, 
WER, mm, ELK, WAR, RRE, 张 丽 红 , 2003) 上 得 到 了 证 明 。 但 鉴于 灾害 发 生 的 特点 ， 先 前 
研究 从 时 间 维 度 上 难以 覆盖 到 灾难 发 生前 和 发 生 中 受灾 地 区 人 民 或 准 受灾 地 区 人 民 的 心理 状况 , 而 台 
风 这 种 天 灾 具 有 可 预测 性 的 特点 ， 可 以 满足 完整 地 从 灾难 发 生前 、 中 、 后 探究 受灾 群众 心理 变化 的 需 
求 。 另 外 ， 台 风 的 可 预测 性 给 台风 地 区 的 群众 提供 了 一 段 准 备 和 等 待 灾难 的 时 期 ， 灾 难 发 生 时 受灾 人 
民 也 是 有 心理 预期 的 ， 这 与 地 震 、 洪 水 等 突 发 性 灾害 有 所 区 别 ， 可 能 使 得 台风 受灾 群众 的 心理 状态 在 
时 间 维 度 产 生 有 别 于 先前 研究 的 一 些 特点 。 
在 获取 台风 受灾 群众 的 心理 特征 的 途径 上 ,“ 微 博 ” 基 于 其 可 记录 时 间 地 点 、 数 据 量 大 这 两 个 明显 
的 优势 ， 成 为 本 研究 很 好 的 数据 来 源 。 因 此 ， 本 研究 拟 基于 台风 雷达 图 ， 分 别 从 时 间 和 地 域 两 个 维度 
画 此 次 山竹 台风 对 受灾 地 区 人 民心 理 特征 的 影响 。 具 体 来 说 ， 选 取 典 型 受灾 区 (广东 〉 和 非 受 灾 地 
区 《安徽 ) 的 人 们 在 台风 过 境 前 、 中 、 后 三 个 时 间 段 内 的 微 博 行为 数据 ， 探 究 人 们 对 此 次 台风 的 关注 
程度 的 变化 , 尝试 用 心理 台风 眼 效 应 从 时 间 和 空间 两 个 维度 来 解释 人 们 面 对 台 风 这 类 自然 灾害 时 的 心 
理 变化 。 

本 研究 以 期 为 帮助 心理 健康 领域 的 研究 者 更 好 地 理解 可 预期 的 应 激 事件 前 后 人 们 的 心理 状态 变 
化 特点 ， 同 时 在 灾 前 预警 、 与 情 管 控 和 灾后 心理 救援 工作 等 方面 均 有 一 定 的 实践 启示 作用 。 


% 


=. 


2 方法 
2.1 研究 设计 
2.1.1 “山竹 台风 影响 下 人 们 的 关注 程度 在 时 间 维 度 上 的 台风 眼 效应 
目的 为 分 别 探究 台风 发 生前 中 后 三 个 时 间 段 内 , 受 台 风 影 响 的 广东 省 人 民 对 山竹 台风 的 关注 程度 
随时 间 的 变化 特点 。 选 取 时 间 段 为 自 变量 ， 共 有 发 生前 ， 发 生 中 ， 发 生 后 三 个 水 平 ; 选取 台风 山竹 的 
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关注 程度 (以 山竹 、 台 风 相 关 关 键 词 的 词 频 表示 ) 为 因 变 量 ， 对 广东 省 用 户 的 微 博 行为 数据 进行 分 析 。 
研究 假设 ， 受 灾区 在 台风 发 生前 、 发 生 中 、 发 生 后 三 个 时 间 段 中 ， 人 们 对 山竹 台风 的 关注 程度 呈现 高 


- 低 -高 变化 的 特点 ， 表 现 出 时 间 维 度 的 台风 眼 效应 。 

山竹 风 影响 下 人 们 的 关注 程度 在 空间 维度 上 的 台风 眼 效应 

受灾 地 区 (广东 ) 与 非 受 灾 地 区 (安徽 ) 对 山竹 台风 的 关注 程度 的 差异 ， 
受灾 与 非 受灾 地 区 相 比 ， 人 们 对 山竹 台风 的 关注 程度 存在 差异 ， 基 


2.1.2 
目的 为 探究 台风 发 生 过 程 中 ， 
因 变 量 与 2.1.1 相同 。 研 究 假设 ， 


于 台风 眼 效应 ， 灾 区 人 民 其 关注 程度 反而 小 于 邻近 的 非 灾 区 人 民 。 


2.2 数据 来 源 


选取 此 次 台风 的 典型 受灾 地 区 和 对 照 地 区 的 微 博 用 户 数据 。 被 选取 的 微 博 数 据 需 要 满足 以 下 条 件 : 
D 发 布 该 微 博 的 用 户 ， 主 页 -基本 资料 -个 人 信息 -所 在 地 为 : 广东 或 安徽 ; 


2)” 微 博 的 发 布 时 间 介 于 台风 过 境 中 及 其 过 境 前 后 三 天 : 2018 年 9 月 1 日 0:00 至 2018 年 9 月 


24:00。 


30 日 


本 研究 息 取 的 数据 内 容 包 括 : 符合 上 述 (1) 所 在 地 要 求 的 用 户 在 上 述 (2) 时 间 段 内 所 发 表 的 所 有 微 


博 的 文字 内 容 ， 包 括 “ 原 创 微 博 ”、 
文字 内 容 )。 最 终 采 集 到 符合 条 们 


NS 


N 


1 ID HEK 地 区 
2 1601518827 8% 安徽 合肥 
3 1601518827 ŽEH 安徽 合肥 
4 1601518827 482% 安徽 合肥 
5 1601518827 ŽEH 安徽 合肥 
6 1601518827 ŽEH 安徽 合肥 
7 1601518827 ŽEH: 安徽 合肥 
8 1601518827 ŽEH 安徽 合肥 
9 1601518827 ŽEH 安徽 合肥 
10 1601518827 ŽEH 安徽 合肥 
11 1601518827 ŽEH 安徽 合肥 
12 1601518827 ŽEH 安徽 合肥 
13 1601518827 ŽEH 安徽 合肥 
4 1601518827 ŽEH 安徽 合肥 
5 1883573041 络 文 梦 剧 场 广东 
6 1883573041 络 文 梦 剧 场 广东 
17 1883573041 络 文 梦 剧 场 广东 
18 1883573041 络 文 梦 剧 场 广东 
9 1883573041 络 文 梦 剧 场 TAR 
J 


20 1883573041 络 文 梦 剧 场 


2.3 数据 整理 


对 所 采集 符合 要 求 的 30 万 条 左右 的 数据 进行 整理 ， 


前 、 过 境 中 和 过 境 


D 将 每 个 省 的 数据 划分 为 台风 过 境 


16 | 


一 18 | 


图 1. 原始 数据 样式 . notepad 


广州 
广州 
广州 
广 

J 
J 


州 


~J 
m 


发 布 时 间 
1537545600 
1537372800 
1535904000 
1536163200 
1537113600 
1536595200 
1537718400 
1536249600 
1537459200 
1535904000 
1535817600 
1537459200 
1537286400 
1536163200 
1538236800 
1536249600 
1536076800 
1538064000 
1538064000 


以 方便 后 期 分 析 处 理 


“转发 微 博 ”( 转 发 微 博 包 括 转发 内 容 的 原文 ， 以 及 转发 者 自己 写 的 
的 微 博 数 据 共计 30 万 条 左右 ， 


形式 如 图 1 所 示 。 
微 博 内 容 
咎 


8:21 6 

我 在 # 签 到 领 红 包 # 打 卡 啦 ! 每 日 签到 令 
先 把 耳 休 洞 钴 上 。 

都 是 好 东西 ， 开 一 个 


恶人 终 有 恶 报 ! 
不 久之 后 又 会 有 一 个 女人 站 出 来 为 自 
转发 微 博 


从 来 中 过 奖 ， 月 饼 节 就 靠 你 了 。 欧 哥 
大 半夜 的 ， 想 参加 个 抽奖 我 容易 吗 我 。 


网 页 链接 # 一 闪 on 
建设 银行 白金 卡 6 万 8 额度 什么 水 平 

我 在 # 签 到 领 红 包 # 打 卡 啦 ! 每 日 签到 令 
哈哈 哈 


美丽 


o 


后 三 个 不 同 的 时 间 段 。 以 台风 过 境 的 时 间 (9 月 
) 为 中 心 ， 将 时 间 惟 变量 的 值 转换 为 3 个 : x < 1537088400 IRA 1, 1537088400 <=x 
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2) 


<= 1537174800 IRJ 2, 1537174800 < x 赋 为 3， 分 别 存储 为 3 个 单独 的 xlsx 文件 ， 如 “广东 -过 境 
前 “广东 -过 境 中 “广东 -过 境 后 ”。 

以 省 为 单位 建立 两 个 单独 的 文件 夹 ， 以 广东 省 为 例 ， 每 个 文件 夹 包括 “广东 省 ”、“ 广 东 - 过 境 前 ”、 
“广东 -过 境 中 ”、“ 广 东 - 过 境 后 ”四 个 xlsx 格式 的 文件 , 每 个 文件 的 首 行 分 别 为 : 用 户 ID、 用 户 名 、 


地 址 、 时 间 惟 、 微 博 内 容 。 内 容 结构 如 图 2 所 示 。 


用 户 ID 用 户 名 地 址 HAIR ABAS 

1694550631 安徽 论坛 ”安徽 合肥 1537286400 人 台风 余 威 致 多 地 暴雨 凶悍 的 "山竹 "会 被 除名 吗 ? ] 17A, 
1694550631 安徽 论坛 ”安徽 合肥 1537286400 【炒面 打 翻 在 地 服务 员 称 重 做 不 料 面 中 吃 出 盘子 碎片 】15 
2521764812 走 拍 旅行 安徽 合肥 | 1538150400| 没 有 领略 过 坝 上 的 秋色 ， 这 旅行 的 路 上 多 黯然 失色 。 胡 守 
2521764812 走 拍 旅行 “安徽 合肥 1537804800 EKAI., SHAHA, RAAR, RAST! E 
2521764812 走 拍 旅行 安徽 合肥 1537545600 【发 现 青海 首屈一指 的 名 胜 古迹 】 青海 塔 尔 寺 ， 十 万 狮子 [ 
2521764812 走 拍 旅行 “安徽 合肥 1537718400 庐阳 中 秋 夜 。 金 健 平 / 摄 # 最 美 赏 月 地 ## 走 拍 旅行 # 摄 影 美 E 
2521764812 走 拍 旅行 安徽 合肥 1537459200 # 建 拍 旅行 # 中 国 最 好 玩 的 地 方 开 封 小 宋 城 ， 好 玩 好 吃 的 地 
2521764812 走 拍 旅行 “安徽 合肥 1537372800 彼岸 花 中 国花 语 :优美 纯洁 朝鲜 花语 :相互 思念 日 本 花语 : 翡 化 
10 2521764812 走 拍 旅行 安徽 合肥 1538236800 一 个 人 ， 要 在 内 心里 给 最 喜欢 的 人 ， 给 喜欢 的 地 方 ， 喜 欢 
11| 2521764812 走 拍 旅行 ”安徽 合肥 1537286400 【发 现 沉睡 的 百年 古镇 ， 比 凤凰 古镇 还 淳朴 】 坐 落 于 福建 : 
12 2521764812 走 拍 旅行 “安徽 合肥 1537372800 找 一 个 喜欢 的 人 ， 一 起 去 看 川西 秋色 吧 ! 徐 旭 / 摄 # 走 拍 旅 
13| 2521764812 走 拍 旅行 安徽 合肥 1537977600 中 国 最 美 滩涂 ， 霞浦。 拍摄 地 : 下 青山 落日 ， 江 村 s 弯 ， 杨 
14| 2521764812 走 拍 旅行 “安徽 合肥 1537718400 今夜 月 明 人 尽 望 ， 不 知 秋思 落 谁 家 ?图 / 徐 国 友 # 最 美 赏 月 
15| 2521764812 走 拍 旅行 ”安徽 合肥 1537286400 台风 后 ， 今 天 下 午 四 点 ， 安 徽 合 肥 东 方 的 天 空 出 现 巨 大 的 * 
16| 1773263881 qalws23 ”安徽 芜湖 1537632000 //@ 午 后 狂 睡 : RH. /@KM: //@ 庆 丰 : 正 能 量 
17| 1773263881 qalws23 ”安徽 芜湖 1537632000 W@ 阴 楼 孤 魂 : 转发 微 博 
18 1773263881 qalws23 ”安徽 芜湖 ”1538064000 /@# ÁW: W@ 红 麟 or 阿 莹 - 废 材 组 //@Mia BESK 
19 1773263881 qalws23 ”安徽 芜湖 1538150400 W@ 阴 楼 孤 魂 : //@ 孔 令 旗 的 地 盘 ://@ 看 看 底牌 : 触目 惊 心 M( 
20| 1773263881 qalws23 ”安徽 芜湖 ”1537459200 //@ 那 谁 家 的 兔 纸 : /@Lilys :又 蠢 又 坏 W@ 只 谈 风 月 猫 ://@3 
21 1773263881 qalws23 ”安徽 芜湖 ”1537286400 W@ 美 食 家 大 雄 : 每 天 送 孩子 上 学 放学 都 是 早晚 高 峰 ， 司 机 
22 1773263881 qalws23 ”安徽 芜湖 ”1537891200 //@ 饼 干 姐 : //@ 暴 雨 雷霆 : 我 以 后 讲课 都 要 提醒 民警 ， 梨 视 
23| 1773263881 qalws23 ”安徽 芜湖 ”1537977600 W@ 杭 之 冯 表 均 建 国 后 成 精 : 所 以 还 是 要 背 锅 啊 。W@ 来 去 : 
24| 1773263881 qalws23 ”安徽 芜湖 ”1538150400 W@ 阴 楼 孤 魂 : //@ 宽 容 公 正 麦 卡 锡 : @ 押 沙 龙 ??//@ 华 朱 咖 t 
25| 1773263881 qalws23 ”安徽 芜湖 ”1537804800 //@ 泉 泗 - 鱼 相 与 处 于 陆 : 恐怖 片 d(?4??) 
26| 1773263881 qalws23 ”安徽 芜湖 ”1537372800 W@ 天 闻 角 川 : DO IT./@ 重 工 组 长 于 彦 舒 : 哈哈 哈哈 哈 M@ 居 
27| 1773263881 qalws23 ”安徽 芜湖 ”1537977600 WG@ 孔 令 旗 的 地 盘 : 现在 社会 给 家 长 、 老 师 教育 孩子 的 权限 


安徽 -过 境 后 © 


中 oom 上 wm 一 


2 安徽 -过 境 后 ”xlsx 内 容 结构 


2.4 数据 分 析 


1) 


2) 


3) 


基于 台风 词汇 库 ， 选 取 29 个 与 台风 相关 的 词汇 ， 对 每 条 “ 微 博 内 容 ” 的 词 频数 进行 统计 。 

将 “用 户 ID” 和 "时 间 戳 ? 均 相 同 且 “地 址 ”为 “广东 ?的 "“ 微 博 内 容 ” 的 台风 相关 词 频数 相 加 得 到 若干 个 
频数 cnti， 每 个 enti 只 对 应 一 个 “用 户 ID”， 从 而 只 对 应 一 个 “地 址 ”， 每 个 “用 户 ID” 不 一 定 只 对 应 
一 个 entis 计算 “用 户 ID” 和 “时 间 戳 均 相 同 的 “ 微 博 内容 ” 的 总 汉字 数 mi。 用 centi 除 以 相应 的 ni, 
得 到 该 用 户 在 该 时 间 段 微 博 内 容 中 台风 相关 词语 的 频率 pi。 将 “时 间 戳 为 1 的 pi 放 入 列表 listl; 
将 “时 间 巷 为 2 的 pi 放 入 列表 list2s 将 “时 间 戳 "为 3 的 pi 放 入 列表 list3。 

将 “用 户 ID 相同 的 “ 微 博 内 容 ” 的 台风 相关 词 频数 相 加 得 到 若干 个 频数 cnti， 每 个 cnti 只 对 应 一 个 
ID, HAD 也 只 对 应 一 个 enti; 计算 “用 户 ID” 相 同 的 “ 微 博 内 容 ” 的 总 字数 mi。 用 centi 除 以 相应 
的 ni, 得 到 该 用 户 在 整个 台风 时 间 段 微 博 内 容 中 台风 相关 词语 的 频率 pi。 将 “地 址 ”为 广东 的 pi Ù 
A listl; 将 SPACE 为 安徽 的 pi 放 入 list2。 

对 第 一 步 和 第 二 步 的 list， 分 别 做 两 两 差异 检验 ， 结 果 示 意图 如 图 3。 
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3 结果 


本 研究 利用 大 数据 分 析 手 段 ， 从 时 间 和 空间 两 个 维度 出 发 探究 了 台风 灾难 发 生前 后 、 受 灾 与 非 
受灾 地 区 人 民心 理 状况 的 动态 变化 轨迹 。 
在 时 间 维 度 上 ， 广 东 省 用 户 微 博 行为 数据 表明 ， 台 风 来 临 前 和 台风 来 临 后 的 “台风 相关 词汇 ” 频 
率 存在 显著 差异 (t=-1.99;p=0.05),， 台风 来 临 前 的 频率 显著 低 于 台风 来 临 后 ,但 并 没有 表现 出 “高 - 低 


-高 ”的 心理 台风 眼 模式 。 我 们 认为 有 两 个 可 能 的 原 


Al: 一 方面 , 广东 地 区 由 于 地 理 位 置 的 特殊 性 ， 台 


风 经 验 和 台风 隐患 较 多 ， 夏 而 在 发 布 台 风 预 警 时 人 们 对 台风 的 关注 并 不 会 显著 增加 ; 男 一 方面 ， 随 
着 对 台风 的 认识 和 应 急 措 施 的 不 断 完善 ， 在 台风 登陆 后 ， 受 灾区 人 人 们 的 台风 体验 和 新 闻 报 道 等 的 不 
断 更 进 ， 进 而 人 们 对 其 的 关注 会 有 所 增加 。 


报道 覆盖 性 很 强 ， 这 导致 非 受 灾 地 区 的 微 博 用 户 也 会 出 现 及 时 更 ; 


异 不 显著 。 


在 空间 维度 上 ， 广 东 省 和 安徽 省 的 微 博 行为 数据 表明 ， 受 灾 地 区 和 非 受 灾 地 区 的 对 台风 的 关注 


程度 在 台风 来 临 前 中 后 整个 时 段 内 ， 都 没有 显著 差异 。 这 可 能 是 因为 在 微 博 上 ， 人 台风 的 相关 推送 和 


台风 的 相关 报道 ， 在 关注 度 上 差 


® Spyder (Python 3.6) = x 
File Edit Search Source Run Debug Consoles Projects Tools View Help 
DS paso pena H c Ege K Æ € > [[:Weerstadninistrator Desktop = 个 
Editor — C: \Wsers\Administrator\Desktop\untitled0. py EX Help ax 
 temp.py {J untitledo. py E F4 Source Console ¥ Object vi 次 
1 A < 
2 "em 
3 Created on Sun Jan 13 15:32:28 2019 
4 
5 @author: Administrator Here you can get help of any object by 
a pressing Ctrl in front of it, either on the 
P i Editor or the Console. 
8 import pickle 
9 with open( r'C:/Users/Administrator/Desktop/ 广 东 中 关键 词 频率 .pkl','*rb') as f: Help can also be shown automatically after 
10 templ = pickle.load(f) writing a left parenthesis next to an object 
11 list1 = list(temp1.values()) You can activate this behavior in Preferences 
12 > Help. 
13 import pickle oe 
14 with open( r'"C:/Users/Administrator/Desktop/ 广 东 后 关键 词 频 率 .pkl', 'rb') as f: 
15 temp2 = pickle.load(f) New to Spyder? Readourtutorial 
16 list2 = list(temp2.values()) 四 
H PEEN 本 Variable explorer File explorer Help 
19 with open( r'C:/Users/Administrator/Desktop/J #RAi ARIAS .pkl','rb') as f: IPython console ax 
20 temp3 = pickle. load(f) 
21 list3 = list(temp3.values()) Q Console 1/4 E 7 
22 In [2]: runfile('C:/Users/Administrator/Desktop/untitled@.py’, a 
23 a=[list1, list2,list3] wdir="C:/Users/Administrator/Desktop' ) 
24 日 工 
25 for i in range(6，3，1): FES 
26 for m in range(i + 1, 3, 1): Run wilcox test ... 
IA 27 import numpy as np 最 终结 果 : te= 1.4229436874950105 p8= @.15475248030114258 
28 from scipy.stats import kstest o2 
9 from scipy.stats import bartlett FEED 
30 from scipy.stats import ttest_ind Ri il text 
31 from scipy.stats import ranksums RS 
f A à r 最 终结 果 : te= 0.007775648565546505 p8= 8.9937959925758341 
2 rom scipy.stats import mannwhitneyu 12 
= wa 
34 tl1,p1 = kstest(a[i], 'norm') FEG 
35 t2,p2 = kstest(a[m], 'norm') nan arligt test ... 
36 print(i,m) 最 终结 果 : t= -1.9905660327799053 p8= 9.84652861767945343 
37 
38 if p1>=0.05 and p2>=0.05: vlIn [3]: v 


Permissions: RW 


End-of-lines: CRLF 


Encoding: UTF-8 


Line: 19 Column: 47 Memory: 70% 


201901.00118v1 


chinaXiv 


® Spyder (Python 3.6) 


File Edit Search Source Run Debug Consoles Projects Tools View Help 


Dea t#ze0 pan Ge pi 
Editor — C: Wsers\Administrator \Desktop\H2S4f. py 
temp. py E untitledd. py 问 方差 分 析 . ri 


c E Eu KM Æ |S > [[:Weerstadninistrator Wesktop 


18 a=[list1, list2] 
19 


20 for i in range(@, 2, 1): 

21 for m in range(i + 1, 2, 1): 

22 import numpy as np 

23 from scipy.stats import kstest 

24 from scipy.stats import bartlett 

25 from scipy.stats import ttest_ind 

6 from scipy.stats import ranksums 
from scipy.stats import mannwhitneyu 


tl1,p1 = kstest(a[i], ‘norm') 
30 t2,p2 = kstest(a[m], ‘norm’) 
31 print(i,m) 
33 if p1>=0.05 Fh p2>=0.@5: 
34 print(" 正 态 ") 
35 t3, SA a[m]) 
36 if p3 
Cane ia st3,"p3=",p3, "方差 齐 ") 
t@,p@ = ttest_ind(a[i], a[m]) 
else: 


40 og p3=",p3, "方差 不 齐 ") 


vile 个 
x Help ax 
#& Source Console ¥ Object vi 次 
和 a 
Here you can get help of any object by 
pressing Ctrl+ in front of it, either on the 
Editor or the Console. 
Help can also be shown automatically after 
writing a left parenthesis next to an object. 
You can activate this behavior in Preferences 
New to Spyder? Read our tutorial 
Variable explorer File explorer Help 
IPython console ax 
Q Console 1A EJ B72 


41 et — test ri aii, equal. var = False) 

42 int(" 最 终 网 ) 

43 FES 
44 else: Run wilcox t 
45 print(" 非 正 态 ") 

46 if len(a)<29: 

47 pet: Run wilcox test ...' In [7]: 
48 t@,p@ = ranksums(a[i], atm]) 

49 else: 

50 t@,p@ = mannwhitneyu(a[i], arm) 

51 print('Run Mann-Whitney U test ...') 

52 print(" BRER: to=",t@,”p@=",p@) 

53 

54 


In [6]: runfile('C:/Users/Administrator/Desktop/ 方 差分 析 .py'， 
wales *C:/Users/Administrator/Desktop’ ) 


test 
最 终结 果 : to- 0.1477373227453836 p@= @.882550075531948 


v 


4 讨论 


本 研究 通过 微 博 行为 数据 分 析 的 方法 , 探究 受灾 地 区 及 间 


Permissions: RW End-of-lines: CRLF 


图 3. 方差 分 析 结 果 示 意图 


Encoding: UTF-8 


Line: 21 Column: 28 Memory: 71% 


间 和 空间 上 存在 台风 眼 效应 ， 结 果 并 未 发 现时 间 和 空间 上 的 台风 眼 效 应 。 除 了 上 述 
可 能 是 研究 方法 的 缺陷 ， 由 于 本 研究 反应 关注 度 的 方法 是 计算 提 及 关键 词 的 词 频 ，F 


汇 ? 的 词 频 并 不 能 很 好 地 反映 对 某 件 


其 邻近 地 区 “山竹 台风 ”的 关注 度 是 否 在 时 


能 的 原因 外 ， 也 


相关 词汇 。 在 后 续 研 究 中 ， 应 该 考虑 使 用 更 丰富 的 指标 反应 关注 程度 。 
本 研究 具有 重要 的 理论 和 实际 意义 。 在 理论 上 ， 能 够 帮助 心理 健康 领域 的 研究 者 更 好 地 理解 可 预 
期 的 应 激 事 件 前 后 (如 台风 、 地 震 、 泥 石 流 等 自然 灾害 )， 受 影响 人 群 的 心理 状态 变化 特点 。 同 时 在 实 


RE, AWA HTT. S 


同时 ， 本 研究 也 存在 一 些 局 限 性 。 首 先 上 文 已 经 提 及 ， 


ARE 


青 管控 和 灾后 心理 救援 工作 等 方面 均 有 一 定 的 启示 作 月 


Ho 


能 “台风 相关 词 


事物 的 关注 程度 ， 例 如 用 户 可 能 表达 了 台风 相关 内 容 但 并 未 提 及 


台风 相关 词汇 ” 词 频 并 不 能 很 好 地 反 


映 对 某 件 事物 的 关注 程度 ， 后 续 研 究 中 ， 应 该 考虑 使 用 更 丰富 的 指标 反应 关注 程度 ， 例 如 “ 负 性 情绪 
相关 词汇 ”的 词 频 。 其 次 ， 本 研究 没有 对 受灾 经 验 维度 进行 控制 。 本 次 山竹 台风 受到 波及 的 地 区 中 也 


存在 着 一 些 有 趣 的 差异 点 ， 比 如 有 些 省 份 从 前 并 没有 台风 ( 例 妇 
多 次 受到 台风 的 打击 (例如 广东 )。 
会 产生 一 定 的 影响 ( 健 哉 ,2008; 


更 好 地 揭示 受灾 地 区 人 们 的 心理 


雷 晓 敏 ,2011)。 未 来 研究 或 可 致力 于 此 , K 
蛙 活 动 状态 。 另 外 ， 本 研究 并 未 宫 括 菲律宾 这 


离开 受灾 


一 受灾 重 


湖南)， 而 有 些 省 份 则 曾经 受到 ， 甚 至 
过 受灾 经 验 ， 对 相关 地 区 的 人 民 面 对 灾害 时 的 心理 特征 可 能 
经 验 的 潜在 影响 ， 


区 。 本 次 山竹 台 


风 在 国际 换 


x 


遇难 人 数 远 i 


馈 于 中 国 。 本 研究 对 于 数据 的 选取 团 于 微 博 ， 而 不 是 更 具 


线 以 东海 域 形成 后 ， 不 断 西 进 ， 先 后 影响 到 了 毗邻 的 中 国 和 菲律宾 地 区 ， 且 菲律宾 地 
具 国 际 通 识 性 的 数据 源 ， 如 气象 局 


资料 或 新 闻 报 道 等 ， 这 使 得 研究 样本 局 限于 中 国 地 区 。 对 比 此 次 台风 对 菲律宾 与 中 国 地 区 造成 影响 的 
差异 性 ， 对 灾 前 预警 和 与 情 管控 等 方面 有 着 重要 的 启示 ， 比 如 人 台风 率先 登陆 广东 ， 可 能 对 毗邻 的 菲 律 


宾 具 有 和 警示 作用 ， 其 民众 对 台风 的 关注 度 和 焦虑 程度 会 呈现 出 “提前 ”的 效果 ， 而 不 是 典型 的 “台风 了 眼 ” 


BUM ARE 
I o 
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The Effect of Typhoon Eye on the Psychological State of the 


Victims under the Impact of Typhoon Mangosteen: Analysis of 


Microblog Behavioral Data Based on Time and Spatial 


Dimensions 


Zhu Zhichen! * Zhou Yiyong!* Wang Yuchen!* Lu Jiangfeng” 4 Cheng Yuhui*:* He Tingting” Zhu Tingshao! 


(' CAS Key Laboratory of Behavioral Science, Institute of Psychology, Beijing, China) 


C CAS Key Laboratory of Mental Health, Institute of Psychology, Beijing 100101, China) 


G State Key Laboratory of Brain and Cognitive Science, CAS Center for Excellence in Brain Science and 
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Intelligence Technology, Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China) 


(* Department of Psychology, University of Chinese Academy of Sciences, Beijing 100049, China) 
Abstract 


The Microblog behavioral data of typical disaster-stricken areas under the Impact of Typhoon Mangosteen 
(Guangdong) and non-disaster areas (Anhui) were selected to test the psychological typhoon eye effect from two 
dimensions of time and space with the method of big data analysis. The results show that there are differences of 
attention degree in the time dimension, but there is no "high-low-high" psychological typhoon eye pattern in the 
affected areas. Specifically, the attention of the affected areas after the transit of typhoon is higher than that before 
the transit of typhoon, while there is no significant difference of the attention of typhoon between the time periods 
before, during and after the transit. There is no significant difference between the disaster-stricken areas and the non- 
disaster areas in the dimension of spatial. Limitations of the study are mainly analyzed in order to provide relevant 
thinking and reference for future research. 


Key words: Typhoon Mangosteen; Time; Spatial; Big Data on Microblog; Psychological Eye Effect of Typhoon 
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附录 1 台风 词 库 227) 


GR, GX, U, MAR, AWN, HREM, AREZ GM, KE, MP, ae, ERN, tell, ol 
R, KA, AMR, AIER, 平均 风速 ,气旋 ,灾害 性 天 气 ， 气压 ， 路径, 亮 温 ， 风 力 ， 风速, 气压 梯度 ， 
RAR, KART, mE 


附录 2 源 代码 
(1) 计算 台风 词 频 代 码 


# -*- coding: utf-8 -*- 
HE E E EH EE Soy HE EDT] EA EG 
import openpyxl 


from collections import defaultdict 
wb = openpyxl.load workbook(r'C:\Users\lbj.WIN-40GLMDFSSV7\Desktop\ 安 徽 - 过 境 后 .xlsx') 


wss = [wb[i] for i in wb.sheetnames] 


fail_datas = [] 
for ws in wss: 
fail data = [] 
try: 
for i in range(2,ws.max_row+1): 
if not ws.cell(row = i,column = 4).value: 
fail_data.append(str(wb.sheetnames[wss.index(ws)])+str(i)) 
elif int(ws.cell(row = i,column = 4).value) < 1537088400: 
ws.cell(row = i,column = 4).value = 1 
elif int(ws.cellow = i,column = 4).value) >= 1537088400 and int(ws.cellrow = i,column = 
4).value)<=1537174800: 
ws.cell(row = i,column = 4).value = 2 
else: 
ws.cell(row = i,column = 4).value = 3 
except Exception as e: 
print(e) 
fail_data.append(str(wb.sheetnames|[wss.index(ws)])+str(i)) 


fail_datas.append(fail_data) 


wb.save(r'C:\Users\lbj.WIN-40GLMDFSSV7\Desktop\ 安 徽 -过 境 后 带 标签 .xlsx') 


filename list = [广东 -过 境 前 .xlsx', 广 东 -过境 中 .xlsx', 广 东 -过 境 后 .xlsx', 安 徽 - 过 境 前 .xlsx', 安徽 -过 境 中 .xlsx, 安徽 -过 境 
后 .xlsx'] 
HHH IES key Nid, {EAN content 的 字典 。 用 于 读 取 所 有 的 文件 中 的 评论 


def id_content(filename): 


wb = openpyxl.load_ workbook(filename) 
wss = [wb[i] for i in wb.sheetnames] 

i=l 

ws = wss[0] 

id_content_dict = defaultdict(list) 

#ID = [] 

#for j in range(1,ws.max_row+1);: 


# ID.append(ws.cell(row=j,column=1)) 
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try: 
while(i<=ws.max_row): 
content_each = [ws.cell(row=i,column=5).value] 
m=i+l 


for m in range(i+1,i+600): 


if ws.cell(row=i,column=1). value == ws.cell(row=m,column=1).value: 


while ws.cell(row=i,column=1 ).value == ws.cell(row=m,column=1).value: 


content_each.append(ws.cell(row=m,column=5).value) 


m= m+l 


id_content_dict[ws.cell(row=i,column=1).value] = content_each 


# print(content_each) 
i=mtl 
# print(i) 


except Exception as e: 
print(e) 
return id_content_dict 


#a=id_content(r'C:\Users\lbj. WIN-40GLMDFSSV7\Desktop\)  #8-i 53 Hil xlsx’) 


import os 
import pickle 
path = r'C:\Users\lbj. WIN-40GLMDFSSV/7\Desktop' 
for i in filename_list: 
file_path = os.path.join(path,i) 
out_file_path = os.path.join(path,i.split(’.')[0]+'.pkt') 
id_content_dic = id_content(file_path) 
with open(out_file_path,'wb') as f: 
pickle.dump(id_content_dic,f) 
##### 将 每 个 省 的 前 中 后 时 期 评论 内 容 变 为 id_content 的 词 


## 棒 拼接 同一 时 间 的 两 个 省 的 评论 的 内 容 

def uni_content(file_name): 
path = r'C:\Users\lbj. WIN-40GLMDFSSV7\Desktop' 
two_all_id_content_dict = defaultdict(dict) 


sec_file_name = filename_list[filename_list.index(file_name)+3] 
pkl filename 1 = os.path.join(path,i.split(’.')[0]+'.pk') 
pkl filename 2 = os.path.join(path,sec_file_name.split('.')[0]+'.pkl') 
with open(pkl_filename_1,'rb') as fl: 
id_content_dict_1 = pickle.load(fl) 
with open(pkl_filename_2,'rb') as f2: 
id_content_dict_2 = pickle.load(f2) 
for j in list(id_content_dict_1.keys()): 
two_all_id_content_dict[j] = id_content_dict_1[j] 
for j in list(id_content_dict_1.keys()): 
for m in list(id_content_dict_2.keys()): 
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ifj—=m: 


uni_content = id_content_dict_1[j]+id_content_dict_2[m] 


two_all id_content_dict[j] = uni_content 
else: 
two_all id_content_dict[m] = id_content_dict_2[m] 


return two all id content dict,sec file name 


HHH E — 4h = TI Ee A 
def uni_content_three(file_name): 


path = r'C:\Users\lbj. WIN-40GLMDFSSV7\Desktop' 


three_content_list = [] 
sec_file_name = filename_list[filename_list.index(file_name)+1] 
third_file_name = filename_list[filename_list.index(file_name)+2] 
pkl_filename_1 = os.path.join(path,1.split(’.')[0]+'.pkt') 
pkl_filename_2 = os.path.join(path,sec_file_name.split('.")[0]+'.pkl') 
pkl_filename_3 = os.path.join(path,third_file_name.split(’.')[0]+'.pkt') 
with open(pkl_filename_1,'rb') as fl: 

id_content_dict_1 = pickle.load(fl) 
with open(pkl_filename_2,'rb') as f2: 

id_content_dict_2 = pickle.load(f2) 
with open(pkl_filename_3,'rb') as f3: 

id_content_dict_3 = pickle.load(#3) 
content_1 = list(id_content_dict_1.values()) 
content_2 = list(id_content_dict_2.values()) 
content_3 = list(id_content_dict_3.values()) 
three_content_list = content_1+content_2+content_3 


return three_content_list 


def keyword_fre(keywords,content_dict):#44H#1+ 5 Hy PA 74 SAT TE ER SE AY EL 
keywords fre dict = {}.fromkeys(keywords,0) 


content_to_str = [str(j) for i in list(content_dict.values()) for j in i ] 
content_list = ["join(i) for i in content_to_str ] 


—" 


content_str =".join(content_list) 

for i in keywords: 
fre_time = content_str.count(i)#HHHOC BEW] HY LA RAL 
fre = fre_time *len(i)/len(content_str) 
keywords _fre_dict[i] = fre 


return keywords _fre_dict 


Is 


def keyword_fre_onecity(keywords,content_list):## 检 计算 出 一 个 省 所 有 时 间 段 的 关键 词 占 总 数 的 比例 


keywords fre dict= {}.fromkeys(keywords,0) 
content_to_str = [str(j) for i in content_list for j ini ] 
content_list_1 =[".join(i) for i in content_to_str ] 


—" 


content_str =".join(content_list_1) 
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for i in keywords: 


fre_time = content_str.count(i) HHH CBE Ta] HY LA RL 
fre = fre_time *len(i)/len(content_str) 
keywords _fre_dict[i] = fre 

return keywords _fre_dict 


def main_2(): 


strl 


' 强 台风 ,台风 , ír, VAR, RN, 超 强 台风 , 气象 专家 , 强风， 灾害, 防护, 危害, 降雨， 检测 ， 预 报 ， 
RKA, RAR, KIFER, FHE, Ae, K? 


TERKA, 气压， 路 径 ， 亮 温 ， 风 力 ， 风速, 气压 梯度 ， KAR, KARE, 
高 压 ' 


str2 = strl .split(",") 
key_word_taifeng = [i.strip() for i in str2] 
path = r'C:\Users\lbj. WIN-40GLMDFSSV7\Desktop' 
for i in filename _list[0:6:3]: 
all_content = uni_content_three(i) 
keyword_ frequency = keyword_fre_onecity(key_word_taifeng,all_content) 
file name = isplit(-)[0]+' 关 键 词 频率 .pkl' 
out file path = os.path.join(path,file_ name) 
with open(out_file_path,'wb') as f: 


pickle.dump(keyword_ frequency, f) 
main_2() 


def main_1(): 


strl 


强 台风 ,台风 ,山竹 ,应 急 预 案 , RN, 超 强 台风 ,气象 专家 ， 强风， 灾害， 防护 , 危害， 降雨， 检测， 预报 
天 气 ,台风 眼 ,风力 等 级 平均 风速 气旋 ,灾害 性 天 气 气压， 路径, FER, 风力, 风速 , 气压 梯度 ， KAR, RAR, 
高 压 ， 


str2 = strl .split(",") 
key_word_taifeng = [i.strip() for i in str2] 


path = r'C:\Users\lbj. WIN-40GLMDFSSV7\Desktop' 
for i in filename_list[0:3]: 


two_all_content,second_file_name = uni_content(i) 
keyword_ frequency = keyword_fre(key_word_taifeng,two_all_content) 


file name = i.split('-)[0]+second file name.split(-)[0]+i.split(.)[0][-1]+' 关 键 词 频率 .pk 
out file path = os.path.join(path,file_name) 
with open(out_file_path,'wb') as f: 


pickle.dump(keyword_ frequency, f) 
main_1() 


test_dic,test_filename = uni_content( 广 东 - 过 境 中 .xlsx') 


with open( r'C:\Users\lbj. WIN-40GLMDFSSV7\Desktop\ 2 WOR HEW AM pkl''rb') as f:####### 读 取 存 的 关键 词 频率 字 
AH = pickle.load(f) 


Hz- 
=z; 
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(2) 方差 分 析 代 码 


import pickle 

import numpy as np 

from scipy.stats import kstest 

from scipy.stats import bartlett 

from scipy.stats import ttest_ind 

from scipy.stats import ranksums 

from scipy.stats import mannwhitneyu 

HHS SCPF AGHA list 

with open( PC:/Users 人 AdministratorDesktop/ 广 东 中 关键 词 频率 .pkl,rb) as f: 
temp! = pickle.load(f) 

listl = list(temp 1.values()) 

with open( r'C:/Users/Administrator/Desktop/ 广 东 后 关键 词 频率 .pkl','rb'") as f: 
temp2 = pickle.load(f) 

list2 = list(temp2.values()) 

with open( r'C:/Users/Administrator/Desktop/ 广 东 前 关键 词 频率 .pkl','rb'") as f: 
temp3 = pickle.load(f) 

list3 = list(temp3.values()) 

a=([list1 ,list2,list3] 

Hitlist 两 两 之 间 进 行 差异 检验 

for i in range(0, 3, 1): 


for m in range(i + 1, 3, 1): 
tl,p1 =kstest(a[i], 'norm') 
t2,p2 = kstest(a[m], 'norm') 
print(i,m) 
if p1>=0.05 and p2>=0.05: 


print(" 正 态 ") 


t3,p3=bartlett(a[i], a[m]) 

if p3 >= 0.05: 
print("t3=",t3,"p3=",p3,"77 29") 
t0,p0 = ttest_ind(a[i], a[m]) 


else: 
print("p3=",p3,"77 AST") 
t0,p0 = ttest_ind(a[i], a[m], equal_var = False) 
print(" 最 终结 果 : t0=",t0,"p0=",p0) 


else: 


print(" 非 正 态 ") 
if len(a)<20: 
print('Run wilcox test ...') 
t0,p0 = ranksums(a[i], a[m]) 
else: 
t0,p0 = mannwhitneyu(a[i], a[m]) 
print('Run Mann-Whitney U test ...') 
print(" 最 终结 果 : t0=",t0,"p0O=",p0) 
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